Лучшие нейросети для генерации голоса

Инструменты
9 всего

Microsoft Azure
Инструмент проектирования и создания приложений. Для развертывания ИИ он использует модели речи, зрения и языка. Инструмент также способен модернизировать инструменты и осуществлять их миграцию в облако. Кроме того, он поддерживает аналитику облачных решений. На данный момент сервис недоступен в России.
Lovo
Генератор реалистичных голосов. В базе 500 аватаров, поддерживает 100 языков. Клонирует голоса, редактирует видео. Есть API.
Murf AI
Инструмент преобразует текст в речь. Предлагает широкий выбор озвучивания на более 120 голосах и 20 языках. Пользователи могут редактировать закадровый текст, чтобы удалить нежелательные фрагменты и фоновой шум.
Synthesys Studio
Сервис для автоматического создания видео с аватаром в виде реального человека. Пользователь выбирает один из аватаров, вводит текст на английском языке или просит нейросеть сгенерировать сценарий. Инструмент генерирует видеоролик, в котором выбранный аватар артикулируя зачитывает текст. Также сервис позволяет генерировать отдельно аудиодорожки и изображения на основе текстового запроса.
Speechify
Инструмент озвучивает тексты на ПК и мобильных устройствах. Есть приложения, расширения для браузеров, интеграции. Можно настраивать скорость чтения, выбирать голоса.
Wellsaid Labs
Сервис для автоматического преобразования текста в аудиофайл. Пользователь вводит текст, а инструмент озвучивает его с помощью одного из выбранных голосов.
PlayHT
Сервис по автоматической озвучке текста и клонирования пользовательского голоса. PlayHT поддерживает больше 100 языков, в том числе и русский, а также множество акцентов и диалектов.
Apihost
Сервис для автоматического написания различного текстового контента, озвучки текста, расшифровки аудиофайлов и видеозаписей, а также генерации изображений на основе текстовых запросов.
Yandex SpeechKit
Сервис для создания и интеграции голосовых помощников, автоматизации колл-центров, контроля качества сервиса и других задач. Модель может генерировать голос на основе заготовленных шаблонов, распознавать речь на более чем 15 языках, а также в скором времени научится определять эмоции собеседников.